我们提出了一种用合成心电图训练神经网络的方法,其模拟可穿戴单引线心电图监测器产生的模拟信号。我们使用域随机化,其中对于每个训练示例,诸如波形形状,RR间隔和噪声之类的合成信号属性。使用合成数据培训的模型与具有真实数据训练的对应物进行比较。在不同物理活性和心房颤动期间记录的心电图中的R波检测用于比较模型。通过允许随机化超出现实数据中通常观察到的内容,性能是对具有实际数据训练的网络的性能的par或取代。实验表明,在不同的测试集上具有不同的种子和训练示例,而无需任何测试设定特定调谐。该方法可以使用实际上自由收集数据与准确的标签一起培训神经网络,无需手动注释,并且当使用疾病使用疾病特定的先验信息时,它会开辟了在心脏病分类上延长使用的合成数据的可能性在心电图一代。另外,可以控制数据的分布消除通常在健康相关数据中观察到的类别不平衡,并且另外,生成的数据本质上是私有的。
translated by 谷歌翻译
Nucleolar organizer regions (NORs) are parts of the DNA that are involved in RNA transcription. Due to the silver affinity of associated proteins, argyrophilic NORs (AgNORs) can be visualized using silver-based staining. The average number of AgNORs per nucleus has been shown to be a prognostic factor for predicting the outcome of many tumors. Since manual detection of AgNORs is laborious, automation is of high interest. We present a deep learning-based pipeline for automatically determining the AgNOR-score from histopathological sections. An additional annotation experiment was conducted with six pathologists to provide an independent performance evaluation of our approach. Across all raters and images, we found a mean squared error of 0.054 between the AgNOR- scores of the experts and those of the model, indicating that our approach offers performance comparable to humans.
translated by 谷歌翻译
For augmentation of the square-shaped image data of a convolutional neural network (CNN), we introduce a new method, in which the original images are mapped onto a disk with a conformal mapping, rotated around the center of this disk and mapped under such a M\"obius transformation that preserves the disk, and then mapped back onto their original square shape. This process does not result the loss of information caused by removing areas from near the edges of the original images unlike the typical transformations used in the data augmentation for a CNN. We offer here the formulas of all the mappings needed together with detailed instructions how to write a code for transforming the images. The new method is also tested with simulated data and, according the results, using this method to augment the training data of 10 images into 40 images decreases the amount of the error in the predictions by a CNN for a test set of 160 images in a statistically significant way (p-value=0.0360).
translated by 谷歌翻译
Current state-of-the-art approaches to text classification typically leverage BERT-style Transformer models with a softmax classifier, jointly fine-tuned to predict class labels of a target task. In this paper, we instead propose an alternative training objective in which we learn task-specific embeddings of text: our proposed objective learns embeddings such that all texts that share the same target class label should be close together in the embedding space, while all others should be far apart. This allows us to replace the softmax classifier with a more interpretable k-nearest-neighbor classification approach. In a series of experiments, we show that this yields a number of interesting benefits: (1) The resulting order induced by distances in the embedding space can be used to directly explain classification decisions. (2) This facilitates qualitative inspection of the training data, helping us to better understand the problem space and identify labelling quality issues. (3) The learned distances to some degree generalize to unseen classes, allowing us to incrementally add new classes without retraining the model. We present extensive experiments which show that the benefits of ante-hoc explainability and incremental learning come at no cost in overall classification accuracy, thus pointing to practical applicability of our proposed approach.
translated by 谷歌翻译
在3D点云上的应用程序越来越需要效率和鲁棒性,在自动驾驶和机器人技术等场景中无处不在使用边缘设备,这通常需要实时和可靠的响应。该论文通过设计一个通用框架来应对挑战,以构建具有(3)均衡和网络二元化的3D学习体系结构。然而,模棱两可的网络和二元化的幼稚组合会导致优化的计算效率或几何歧义。我们建议在网络中同时找到标量和向量特征,以避免这两种情况。确切地说,标量特征的存在使网络的主要部分是可动的,而矢量特征则可以保留丰富的结构信息并确保SO(3)均衡。提出的方法可以应用于PointNet和DGCNN等一般骨干。同时,对ModelNet40,Shapenet和现实世界数据集ScanObjectnn进行的实验表明,该方法在效率,旋转稳健性和准确性之间取决于巨大的权衡。这些代码可在https://github.com/zhuoinoulu/svnet上找到。
translated by 谷歌翻译
高质量数据对于现代机器学习是必需的。但是,由于人类的嘈杂和模棱两可的注释,难以获取此类数据。确定图像标签的这种注释的聚合导致数据质量较低。我们提出了一个以数据为中心的图像分类基准,该基准具有9个现实世界数据集和每个图像的多次注释,以调查和量化此类数据质量问题的影响。我们通过询问如何提高数据质量来关注以数据为中心的观点。在数千个实验中,我们表明多个注释可以更好地近似实际的基础类别分布。我们确定硬标签无法捕获数据的歧义,这可能会导致过度自信模型的常见问题。根据呈现的数据集,基准基准和分析,我们为未来创造了多个研究机会。
translated by 谷歌翻译
在自动驾驶领域内朝着更高水平的自动化迈进的进步伴随着对车辆操作安全的需求的增加。由计算资源的限制引起的,算法的计算复杂性之间的权衡及其在确保自动化车辆安全运行的潜力之间经常遇到。情境感知的环境感知提出了一个令人鼓舞的例子,其中计算资源分布在感知区域内的区域,这些区域与自动车辆的任务相关。尽管经常利用先前的地图知识来确定相关区域,但在这项工作中,我们提供了仅依赖在线信息的安全区域的轻量级标识。我们表明,我们的方法可以在关键方案中实现安全的车辆操作,同时在环境感知中保留了不均匀分配资源的好处。
translated by 谷歌翻译
自动化代理的环境感知领域的进步导致生成的传感器数据持续增加。处理这些数据的可用计算资源必将变得不足以实时应用程序。通过基于代理商的情况识别最相关的数据(通常称为情况意识)来减少要处理的数据量,并增加了研究的兴趣,并且预计互补方法的重要性将在不久的将来进一步增加。在这项工作中,我们将最近引入的情境感知环境感知概念的适用性范围扩展到Unicaragil项目的分散自动化体系结构。考虑到车辆的特定驾驶能力,并以后处理方式使用有关目标硬件的实际数据,我们提供了每日降低功耗的估计,该功耗累积到36.2%。在实现这些有希望的结果的同时,我们还表明,如果应最佳利用情况意识的好处,则需要考虑软件模块设计中的数据处理中的可扩展性以及功能系统的设计。
translated by 谷歌翻译
各种图形渲染和处理操作需要深度图。当在分布式系统中执行此类操作时,经常需要深度图流量流,并且在大多数情况下需要快速执行压缩,这就是为什么经常使用视频编解码器的原因。标准视频编解码器的硬件实现甚至可以在资源约束的设备上实现相对较高的分辨率和帧率组合,但是不幸的是,这些实现当前不支持RGB+深度扩展。但是,它们可以通过将深度图填充到RGB或YUV框架中来用于深度压缩。我们使用深度图包装的组合研究深度图压缩,然后使用标准视频编解码器进行编码。我们表明,深度图被包装的精度对由包装方案的组合和限制性压缩造成的误差产生了巨大而无处不在的影响。因此,我们提出了一个由神经网络模型辅助的可变精度包装方案,该模型可以预测给定比特率约束的每个深度图的最佳精度。我们证明该模型的产生几乎最佳的预测,并且可以将其集成到具有现代硬件的高架开销的游戏引擎中。
translated by 谷歌翻译
人工智能(AI)已成为日常谈话的一部分和我们的生活。它被认为是彻底改变世界的新电力。 AI在行业和学院都有大量投资。但是,目前的AI辩论中也有很多炒作。基于所谓的深度学习的AI在许多问题中取得了令人印象深刻的结果,但它的极限已经可见。自20世纪40年代以来,AI一直在研究中,由于过度预期和相关的失望,该行业已经看到许多起伏。本书的目的是提供AI,其历史,其潜力和局限性的现实画面。我们相信AI是一个助手,而不是人类的统治者。我们首先描述了一个人是什么以及它在几十年中如何发展。基础之后,我们向大规模数据对人工智能主流的重要性解释了大规模数据的重要性。涵盖了AI,方法和机器学习的最常见的表示。此外,介绍了主要应用领域。计算机愿景一直是AI发展的核心。本书提供了对计算机愿景的一般介绍,并包括接触我们自己研究的结果和应用。情绪是人类智慧的核心,但在AI中使用了很少的用途。我们介绍了情绪情报的基础知识和我们对主题的研究。我们讨论超级智力,超越人类理解,解释为什么在目前的知识的基础上,这种成就似乎是不可能的,以及如何改善AI。最后,摘要是由AI的当前状态制成,并在将来做什么。在附录中,我们了解AI教育的发展,特别是从我们自己的大学内容的角度来看。
translated by 谷歌翻译